Podsumowanie

Raport powstał w celu analizy zbioru danych dotyczącego baterii udostępnionego przez Materials Project, inicjatywę naukową Departamentu Energii USA, której celem jest dostarczanie otwartych danych i narzędzi do analizy materiałów.

Podczas analizy skupiono się na identyfikacji zależności między różnymi atrybutamibaterii, takimi jak pojemność, gęstość energii, napięcie, czy stabilność. W raporcie wykorzystano różne techniki wizualizacji danych, aby lepiej zrozumieć zależności między atrybutami. Na końcu przeprowadzono predykcje stabilności naładowania i rozładowania baterii, wykorzystując regresję liniową oraz las losowy z walidacją krzyżową.

Wykorzystane biblioteki

  • tidyverse
  • readr
  • ggplot2
  • plotly
  • corrplot
  • caret
  • DT
  • knitr
  • randomForest

Zbiór Danych

Przykładowe dane z wybranymi kolumnami
Battery.ID Battery.Formula Working.Ion Formula.Charge Formula.Discharge Max.Delta.Volume
mp-30_Al Al0-2Cu Al Cu Al2Cu 3.043399
mp-1022721_Al Al1-3Cu Al AlCu Al3Cu 1.243653
mp-8637_Al Al0-5Mo Al Mo Al5Mo 4.762574
mp-129_Al Al0-12Mo Al Mo Al12Mo 12.723893
mp-91_Al Al0-12W Al W Al12W 12.494598
mp-1055908_Al Al0-12Mn Al Mn MnAl12 18.236156
Average.Voltage Gravimetric.Capacity Volumetric.Capacity Gravimetric.Energy
0.0890331 1368.481 5562.790 121.84009
-0.0215863 1112.937 4418.980 -24.02423
0.1227568 1741.504 7175.702 213.78156
0.0431214 2298.811 7346.232 99.12801
0.0292342 1900.745 7332.719 55.56677
0.0397314 2547.693 7592.916 101.22330
Volumetric.Energy Atomic.Fraction.Charge Atomic.Fraction.Discharge
495.27253 0.0 0.6666667
-95.38962 0.5 0.7500000
880.86651 0.0 0.8333333
316.78006 0.0 0.9230769
214.36621 0.0 0.9230769
301.67688 0.0 0.9230769
Stability.Charge Stability.Discharge Steps Max.Voltage.Step
0.0000000 0.0000000 1 0
0.0740612 0.0962458 1 0
0.4114601 0.0452120 1 0
0.0000000 0.0114456 1 0
0.0000000 0.0000000 1 0
0.1454643 0.0000000 1 0

Suma brakujących wartości w zbiorze danych wynosi 0.

Analiza podstawowych statystyk

Rozmiar zbioru danych

Liczba obserwacji: 4351
Liczba atrybutów: 17

Atrybuty

  • Battery ID: Identyfikator baterii.
  • Battery Formula: Wzór chemiczny materiału baterii.
  • Working Ion: Główny jon, który odpowiada za transport ładunku w baterii.
  • Formula Charge: Wzór chemiczny materiału baterii w stanie naładowanym.
  • Formula Discharge: Wzór chemiczny materiału baterii w stanie rozładowanym.
  • Max Delta Volume: Zmiana objętości w % dla danego kroku napięcia za pomocą wzoru: max(charge, discharge)/min(charge, discharge) -1.
  • Average Voltage: Średnie napięcie dla poszczególnego kroku napięcia.
  • Gravimetric Capacity: Pojemność grawimetryczna, czyli ilość energii na jednostkę masy (mAh/g).
  • Volumetric Capacity: Pojemność wolumetryczna, czyli ilość energii na jednostkę objętości (mAh/cm³).
  • Gravimetric Energy: Gęstość energii w odniesieniu do masy baterii (Wh/kg).
  • Volumetric Energy: Gęstość energii w odniesieniu do objętości baterii (Wh/L).
  • Atomic Fraction Charge: Udział atomowy składników w stanie naładowanym.
  • Atomic Fraction Discharge: Udział atomowy składników w stanie rozładowanym.
  • Stability Charge: Wskaźnik stabilności materiału w stanie naładowanym.
  • Stability Discharge: Wskaźnik stabilności materiału w stanie rozładowanym.
  • Steps: Liczba odrębnych kroków napięcia od pełnego naładowania do rozładowania, oparta na stabilnych stanach pośrednich.
  • Max Voltage Step: Maksymalna bezwzględna różnica między sąsiednimi krokami napięcia.

Podsumowanie

Analiza atrybutów

Working Ion

Najbardziej widocznym jonem w zbiorze danych jest lit (Li). Nie jest to zaskakujące, biorąc pod uwagę powszechne wykorzystanie baterii litowo-jonowych w różnych zastosowaniach,Sód (Na) i potas (K) są również stosunkowo powszechne co można zaobserować na wykresie.

Battery Formula

10 Najczęściej Używanych Battery Formula
Battery Formula Count
Li0-1V2OF5 19
Li0-1CoPO4 18
Li0-1FePO4 18
Li0-3MnFeCo(PO4)3 17
Li0-1MnPO4 15
Li0-1V4OF11 15
Li0-1V4O5F7 12
Li0-1VF5 12
Li0-1CrP2O7 11
Li0-2MnP2O7 11

Formula Charge

10 Najczęściej Używanych Formula Charge
Formula Charge Count
MnO2 49
TiO2 47
VO2 46
CrO2 45
CoO2 43
NiO2 41
FeO2 36
FePO4 26
WO2 25
CoPO4 24

Formula Discharge

10 Najczęściej Używanych Formula Discharges
Formula Discharge Count
LiCoPO4 19
LiFePO4 19
LiMnPO4 19
LiV2OF5 19
Li5Mn6(BO3)6 18
Li3MnFeCo(PO4)3 17
LiV4OF11 15
Li2MnP2O7 14
Li2FeSiO4 13
LiCrPO4 12

Average Voltage

Znacząca większość obserwacji dotyczyła średnich napięć z przedziału od 0 do około 10 V. Istnieje niewielka liczba obserwacji dotyczących zarówno bardzo niskich (poniżej -10 V), jak i bardzo wysokich (powyżej 10 V) wartości średniego napięcia.

Max Delta Volume

Większość obserwacji dotyczyła niewielkich zmian objętości.

Gravimetric Capacity

Największa ilość próbek ma pojemność grawimeryczną w przedziale od 0 do około 500 mAh/g

Volumetric Capacity

Znacząca większość próbek ma pojemność wolumetryczną w przedziale od 0 do około 2000 mAh/cm3

Gravimetric Energy

Większość próbek wykazuje gęstość energii w zakresie od 0 do około 2000 Wh/kg.

Volumetric Energy

Przeważająca liczba próbek ma gęstość energii wolumetrycznej w zakresie od 0 do około 5000 Wh/L.

Stability Charge

Znacząca większość obserwacji dotyczyła niskich wartości ładunku stabilizującego, skupionych w przedziale od 0 do około 0,5 jednostki na osi X.

Korelacje między zmiennymi

Macierz korelacji

Macierz korelacji doskonale sprawdza się do identyfikowania zależności między różnymi atrybutami (cechami) danych. Wykorzystano ją aby sprawdzić współczynnik korelacji między naszymi atrybutami.

“Gravimetric Energy” vs “Volumetric.Energy”

Współczynnik korelacji 0.9283253 wskazuje na silny związek między gęstością energii grawimetrycznej a wolumetrycznej.

“Gravimetric.Capacity” vs “Volumetric.Capacity”

Współczynnik korelacji między pojemnością grawimetryczną a pojemnością wolumetryczną wynosi 0.8584163.

“Volumetric Capacity” vs “Atomic Fraction Discharge”

Współczynnik korelacji wynosi 0.6180186.

Predykcje

Stability Charge

W przypadku predykcji stabilności naładowania, wykorzystamy regresję liniową.

Model Summary for Stability.Charge
Metric Value
RMSE 0.3980418
Rsquared 0.1268066
MAE 0.1474695

Stability Discharge

W przypadku predykcji stabilności rozładowania, wykorzystamy random forest z walidacją krzyżową.

Model Summary for Stability.Discharge
Metric Value
Number of Trees 10.0000000
Mtry 2.0000000
RMSE 0.1642395
Rsquared 0.8116191
MAE 0.0558046